# SMOTE过采样数据均衡
import pandas as pd
from imblearn.over_sampling import ADASYN

# 假设你的数据存储在一个CSV文件中，我们先将其读入一个Pandas DataFrame
data = pd.read_csv('no_neg_DBSCAN.csv')

# 定义特征和标签
X = data.drop(['Air Quality'], axis=1)  # 特征列
y = data['Air Quality']  # 标签列

# 创建ADASYN对象
adasyn = ADASYN()

# 应用ADASYN过采样
X_res, y_res = adasyn.fit_resample(X, y)

# 将过采样后的数据转换回DataFrame
X_res_df = pd.DataFrame(X_res, columns=X.columns)
y_res_df = pd.DataFrame(y_res, columns=['Air Quality'])

# 合并特征和标签
resampled_data = pd.concat([X_res_df, y_res_df], axis=1)

resampled_data.to_csv('no_neg_DBSCAN_adasyn_g2.csv', index=False)